toCサービス × AI実装のリアル 〜成功談から失敗談まで〜「ハッカー鮨」
https://gyazo.com/2231e53546e25e32eced8457d10cd7fb
toCサービス × AI実装のリアル 〜成功談から失敗談まで〜「ハッカー鮨」 - connpass
AI活用における精度検証と信頼性担保
株式会社マイベスト
橋本綾斗
https://gyazo.com/1e9712bcaf532974ef6604c15fd826e2
https://gyazo.com/6d9850c6ec0474882f671042cdb9375e
https://gyazo.com/511e8b273e3306196da8753c448a521f
https://gyazo.com/4b8534608c3be1d76fc68105be910eea
精度検証の信頼性担保
アプローチ1
既存の商品を使った評価
正解データとして同じ回答となれば正解
正解を高めるように改善サイクルを回す
精度検証
80%までで頭打ち
既存のデータとの比較ではうまくできない
商品情報が正規化が微妙
AIが高出力した場合は不正解にしてしまう
測定した精度と同じ環境で出せるかが保証できない
アプローチ2
https://gyazo.com/9e3ee8b7060a225eed75a69b89d24cd2
本番で部分導入して評価
人間に修正されなかったら正解
正誤判定ではなく人間がどう修正したかがわかる
本番環境でデプロイして待つ必要はある
正誤判定と修正内容でより詳細な分析ができるようになった
人間のチェックを外せるところはまだ先
https://gyazo.com/cae437d1f6628e9caf36e15146494f99
モバイルチームのAI駆動開発 モノレポ × AI で開発プロセスを再定義する
株式会社カウシェ
小村祐輝
https://gyazo.com/cd717c9a6e365ed7667c0bd1acd537e9
https://gyazo.com/1cd55756598208f382bb416707d9a521
https://gyazo.com/928ab2ff2bb82c69de6752ee5f0f34d5
モノレポはAIの知識基盤
ドメイン全体を理解した状態でコードを書ける
ルール・スキル・コマンドを整備している
Rules
アーキテクチャ、テスト規約、命名規則
Skills&コマンド
レビュー、コミットPR
実例:AIレビューの進化
1つのAIにレビューさせるとコンテキスト逼迫で指摘がブレる
観点ごとにサブエージェントを独立させる
構造・UI・API・セキュリティ・テスト・分析
aggregatorが集約
設計原則
AIは決定論的な挙動をしてくれない課題
スクリプトはMarkdownに書かずにSkill化する
確率的なブレは残るが観点を忘れるのは解消している
https://gyazo.com/96b0cbc356952f55094579f752c9b3d1
AIネイティブ組織に向かうための道のり
株式会社STRACT
加藤貴晴
toCはスピードは正義
AIコーディングは合理的な選択
心理的な問題
そもそも変わることへの不安
わからないものへの恐怖
SWEの仕事が奪われるのではないか
既存のコードを汚される不安
にがい経験
AIで出力したものを修正する
レビュー・動作確認疲れ
泥臭くやったこと
メンバーとの1on1
予算の確保
当たり前のことはまずやる
CLAUDE.md
skills書くとか
レビューモデルに学習
Issueやdescriptionを書かせる
本当にやるべきことを確認する
プロダクトを届けることがバリュー
AIが入って変わった未来を描く
AIネイティブ化はマインドの変革
https://gyazo.com/4d3ab15e62cab3004d1d8e749141aafe
ありがとうLLM。高文脈言語データ活用の第一歩
株式会社ビビッドガーデン
hirashin
食べチョク
ユーザー特性
具体的な購入意図があるユーザー
ブラウジングユーザー
投稿の自然言語をいかに資産化するか
https://gyazo.com/a44039f8aebcfd3b867829e151a8e081
https://gyazo.com/9ce2cf59db54dd8bd38e23c04d39f7c8
取り組み1
投稿情報の定量化
LLMで構造化、特性抽出
ABSAのクアッド抽出
LLMが抽出して人間による間引き
ファクト担保の面で調整
少数な投稿での信頼性
マーケターが参考にする
取り組み2
https://gyazo.com/c7bbde3e55d1d00bfc4fc773258c7978https://gyazo.com/8fa3f7cc0e00bc0f4315843f468e3734
A:グッとくる投稿の発掘
社内Slackで発掘したのをAIに学習させる
素のAIにいい感じの投稿を見つけてくるようにする
B:学ばせたAIのがよい投稿を拾ってきやすい
商業的に強そうなワードが並ぶ
満足・驚き等
ABCテストをさせる
C:ランダム表示された投稿を混ぜる
ABどちらもほぼ同数、同率だった
答えはユーザーはもっている
https://gyazo.com/0fd9a1ec4e2031efe87bd7b39066bd74
https://gyazo.com/58032494d7ff5cd9e634f3467b3d5c74